Nature子刊：Salmon不比对快速宏基因组基因定量

Original 宏基因组宏基因组 2022-05-08

Salmon：使用双阶段推理对转录本表达进行快速且有偏差意识的量化

Salmon: fast and bias-aware quantification of transcript expression using dual-phase inference

Nature Methods [IF:28.467]

2017-03-06 Brief Communication （短通讯）

DOI: https://doi.org/10.1038/nmeth.4197

第一作者：Rob Patro¹

通讯作者：Rob Patro¹ 和 Carl Kingsford⁵

其它作者：Geet Duggal2, Michael I Love3,4,
Rafael A Irizarry3,4

作者单位：

¹美国纽约州石溪市，石溪大学计算机科学系（Department of Computer Science, Stony Brook University, Stony Brook, New York, USA）

⁵美国宾夕法尼亚州匹兹堡，卡内基梅隆大学计算生物学系（Computational Biology Department, Carnegie Mellon University, Pittsburgh, Pennsylvania, USA）

导读

Salmon可提供快速且偏见的转录表达定量

Salmon是一种准确快速定量转录本丰度的方法；
它是第一个可校正转录组片段GC含量范围内偏差的定量工具，大大提高了丰度估计的准确性以及后续差异表达分析的可靠性；
新的双相并行推理算法和功能丰富的偏差模型与超快速读长映射过程结合在一起；
其计算速度快，硬盘空间占用少等优点，也在宏基因组基因定量中广泛应用;
软件支持多种常用安装方式，且支持多样本汇总为表格。

点评：传统的定量工具采用比对的方法，对于人类几万个基因都需要消耗几小时，而面对微生物组动辄千万的基因更是费时费力。Salmon的非比策略具有速度上的极大优势，同时不会生成传播的巨型SAM格式比对文件。Salmon又是体现了出版平台对文章引用存在巨大影响的例子，该软件2015年发布在BioRxiv上面，两年只有10来次的引用，截止目前4年也只有37个引用。而文章被Nature Methods接收发表后，短短两年引用达891次，相同时间内此用高达上百倍，可见这咱28分的杂志确实获得了同行的广泛关注。所以好的东西，传播平台也很重要，比如发了文章记得来宏基因组公众号宣传，让你免费体验高分文章才有的传播效果。

摘要

我们介绍Salmon，这是一种从RNA-seq读长中定量转录本丰度的方法，该方法准确而又快速。Salmon是第一个可校正转录组片段GC含量范围内偏差的定量工具，我们证明该方法大大提高了丰度估计的准确性以及后续差异表达分析的可靠性。Salmon将新的双相并行推理算法和功能丰富的偏差模型与超快速读长映射过程结合在一起。

详者注：目前该软件在宏基因组上千万数量的基因定量中有广泛应用，效率惊人。

主要结果

使用来自GEUVADIS和SEQC研究的实验数据以及来自Polyester和RSEM-sim仿真器的综合数据，我们将Salmon与Kallisto和eXpress + Bowtie2进行了基准比较，这两种方法也都实现了自己的偏差模型。我们还使用传统比对（来自Bowtie2）作为输入（表示为“Salmon（a）”）测试了Salmon。我们显示Salmon在准确性方面通常胜过Kallisto和eXpress（图1以及补充图2和3）。我们注意到，所有这些工具都解决了转录本量化问题，并且没有识别或组装新颖的转录本（补充说明1）。

图1. Salmon与同类软件对比的表现

Figure 1 | Performance of Salmon

（a）在聚酯（Polyester）模拟数据的所有16个重复下，估计丰度和真实丰度之间的绝对对数倍数变化的中位数（log-transformed fold changes，lfc）。lfc越接近0，真实和估计的丰度就越相似。左面板和右面板显示了使用从实验数据（在线方法中的详细信息，地面真实情况模拟数据）获悉的不同GC偏向曲线模拟的样品下，对数倍数变化的分布。

（b）Salmon与传统比对方法kallisto和eXpress的比较，准确度指标中所述的平均绝对相对差异（mean absolute relative differences，MARD）的分布，该结果由RSEM-sim生成了20个模拟重复。Salmon和Kallisto产生的MARD相似，尽管Salmon的MARD分布比Kallisto的小得多（Mann-Whitney U检验，p = 0.00017）。两种方法都优于eXpress（Mann-Whitney U检验，p = 3.39781×10^-8）。

（c）在典型的FDR值下，使用Salmon的估计找到真正的差异转录本的敏感性比使用Kallisto的估计要高53％–450％，比使用eXpress的Polyester模拟数据的估计要高210％-250％。

（d）对于30个GEUVADIS样本，当组之间的对比度仅是技术上的混淆（即测序的中心）时，预期FDR为1％的转录本数量称为差异表达（differentially expressed，DE）。Salmon产生的DE转录本少于其他方法的一半。对样品进行置换，或在测序中心内测试DE，所有方法的DR<1%转录本平均称为DE。

扩展阅读

6不比对快速估计基因丰度Salmon

系列教程：微生物组入门 Biostar 微生物组宏基因组

专业技能：学术图表高分文章生信宝典不可或缺的人

一文读懂：宏基因组寄生虫益处进化树

必备技能：提问搜索 Endnote

文献阅读热心肠 SemanticScholar Geenmedical

扩增子分析：图表解读分析流程统计绘图

16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun

在线工具：16S预测培养基生信绘图

科研经验：云笔记云协作公众号

编程模板: Shell R Perl

生物科普: 肠道细菌人体上的生命生命大跃进细胞暗战人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外5000+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份，另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍未解决群内讨论，问题不私聊，帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

穿了跟没穿一样，胸型赞到爆！天然乳胶，性感到让男人腿软！

Nature子刊：Salmon不比对快速宏基因组基因定量

Salmon：使用双阶段推理对转录本表达进行快速且有偏差意识的量化

导读

摘要

主要结果

图1. Salmon与同类软件对比的表现

扩展阅读

猜你喜欢

写在后面

您可能也对以下帖子感兴趣

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

穿了跟没穿一样，胸型赞到爆！天然乳胶，性感到让男人腿软！

生成图片，分享到微信朋友圈

Nature子刊：Salmon不比对快速宏基因组基因定量

Salmon：使用双阶段推理对转录本表达进行快速且有偏差意识的量化

导读

摘要

主要结果

图1. Salmon与同类软件对比的表现

扩展阅读

猜你喜欢

写在后面

您可能也对以下帖子感兴趣